# coding:utf8
from utils.embedding.dashscope_embedding import DashscopeEmbedding
from utils.storage.vector_store import VectorStore

# 初始化文档列表
documents = [
    "机器学习是人工智能的一个分支。",
    "深度学习是一种特殊的机器学习方法。",
    "监督学习是一种训练模型的方式。",
    "强化学习通过奖励和惩罚进行学习。",
    "无监督学习不依赖标签数据。",
]

# 创建向量数据库
vector_store = VectorStore(document=documents)

# 使用 Dashscope Embedding 模型对文档进行向量化
embedding_model = DashscopeEmbedding()

# 获取文档向量并存储
vector_store.get_vector(embedding_model)

# 持久化存储到本地
vector_store.persist('storage')

# 模拟用户查询
query = "什么是深度学习？"
result = vector_store.query(query, embedding_model)

print("检索结果：", result)

# 查看持久化向量存储
import numpy as np
loaded_array = np.load('./storage/vectors.npy')
print(loaded_array)